
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型开放但禁止商用用途。
开放但禁止商用用途。
每个token只需要5.28%的算力,精度就能全面对标Llama 3。
就在刚刚,法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言,而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前,已经开放API与IDE插件供用户使用。
马斯克最近哭穷表示,xAI需要部署10万个H100才能训出Grok 3,影响全球的大模型算力荒怎么解?昨天开源的这款MoE大模型,只用了1/19算力、1/19激活参数,性能就直接全面对标Llama 3-70B!
大模型价格战打得火热 这几天,大模型的价格战打得火热。模型价格一降再降,百度、科大讯飞、腾讯甚至直接宣布免费。
Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构,甚至让Andrej Karpathy亲自下场「背书」。
5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?
Llama 3开源后,聊天机器人Meta AI也宣布使用新模型作为基座,在Meta旗下的各种软件(Meta.ai、Instagram、Facebook、WhatsApp)中都可以进行免费体验。
Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!
堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。